import chromadb

# 初始化Chroma客户端
client = chromadb.PersistentClient(path="data/chroma_db")

# 获取test_collection_56856集合
print("尝试获取test_collection_56856集合...")
collection = client.get_collection(name="test_collection_56856")

# 获取集合中的所有文档
print("获取集合中的所有文档...")
all_docs = collection.get()

# 打印文档数量
print(f"集合中的文档数量: {len(all_docs['ids'])}" if 'ids' in all_docs else "集合中没有文档")

# 打印文档内容和元数据（如果有）
if 'documents' in all_docs and all_docs['documents']:
    print("\n前5个文档的内容摘要:")
    for i, doc in enumerate(all_docs['documents'][:5]):
        print(f"\n文档 {i+1}:")
        print(f"内容: {doc[:300]}..." if len(doc) > 300 else f"内容: {doc}")
        # 打印元数据
        if 'metadatas' in all_docs and all_docs['metadatas'] and len(all_docs['metadatas']) > i:
            print(f"元数据: {all_docs['metadatas'][i]}")
else:
    print("集合中没有找到文档内容")